最近,神经场景表征在视觉上为3D场景提供了令人印象深刻的结果,但是,他们的研究和进步主要仅限于计算机图形或计算机视觉中的虚拟模型的可视化,而无需明确考虑传感器和构成不确定性的情况。但是,在机器人技术应用程序中使用这种新颖的场景表示形式,需要考虑神经图中这种不确定性。因此,本文的目的是提出一种新的方法,用于使用不确定的培训数据训练{\ em概率的神经场景表示},这可以使这些表示形式纳入机器人技术应用中。使用相机或深度传感器获取图像包含固有的不确定性,此外,用于学习3D模型的相机姿势也不完美。如果这些测量值用于训练而无需考虑其不确定性,则结果模型是非最佳的,并且所得场景表示可能包含诸如Blur和Un-Cheven几何形状之类的伪影。在这项工作中,通过以概率方式专注于不确定信息的培训来研究与学习过程的不确定性整合问题。所提出的方法涉及以不确定性项的明确增加训练可能性,以使网络的学习概率分布相对于培训不确定性最小化。可以证明,除了更精确和一致的几何形状外,这还导致更准确的图像渲染质量。对合成数据集和真实数据集进行了验证,表明所提出的方法的表现优于最先进的方法。结果表明,即使训练数据受到限制,该提出的方法也能够呈现新颖的高质量视图。
translated by 谷歌翻译
神经场景表示,例如神经辐射场(NERF),基于训练多层感知器(MLP),使用一组具有已知姿势的彩色图像。现在,越来越多的设备产生RGB-D(颜色 +深度)信息,这对于各种任务非常重要。因此,本文的目的是通过将深度信息与颜色图像结合在一起,研究这些有希望的隐式表示可以进行哪些改进。特别是,最近建议的MIP-NERF方法使用圆锥形的圆丝而不是射线进行音量渲染,它使人们可以考虑具有距离距离摄像头中心距离的像素的不同区域。所提出的方法还模拟了深度不确定性。这允许解决基于NERF的方法的主要局限性,包括提高几何形状的准确性,减少伪像,更快的训练时间和缩短预测时间。实验是在众所周知的基准场景上进行的,并且比较在场景几何形状和光度重建中的准确性提高,同时将训练时间减少了3-5次。
translated by 谷歌翻译
Valuing mineral assets is a challenging task that is highly dependent on the supply (geological) uncertainty surrounding resources and reserves, and the uncertainty of demand (commodity prices). In this work, a graph-based reasoning, modeling and solution approach is proposed to jointly address mineral asset valuation and mine plan scheduling and optimization under supply and demand uncertainty in the "mining complex" framework. Three graph-based solutions are proposed: (i) a neural branching policy that learns a block-sampling ore body representation, (ii) a guiding policy that learns to explore a heuristic selection tree, (iii) a hyper-heuristic that manages the value/supply chain optimization and dynamics modeled as a graph structure. Results on two large-scale industrial mining complexes show a reduction of up to three orders of magnitude in primal suboptimality, execution time, and number of iterations, and an increase of up to 40% in the mineral asset value.
translated by 谷歌翻译
Channel charting (CC) is an unsupervised learning method allowing to locate users relative to each other without reference. From a broader perspective, it can be viewed as a way to discover a low-dimensional latent space charting the channel manifold. In this paper, this latent modeling vision is leveraged together with a recently proposed location-based beamforming (LBB) method to show that channel charting can be used for mapping channels in space or frequency. Combining CC and LBB yields a neural network resembling an autoencoder. The proposed method is empirically assessed on a channel mapping task whose objective is to predict downlink channels from uplink channels.
translated by 谷歌翻译
在过去的几年中,卷积神经网络(CNN)在各种现实世界的网络安全应用程序(例如网络和多媒体安全)中表现出了有希望的性能。但是,CNN结构的潜在脆弱性构成了主要的安全问题,因此不适合用于以安全为导向的应用程序,包括此类计算机网络。保护这些体系结构免受对抗性攻击,需要使用挑战性攻击的安全体系结构。在这项研究中,我们提出了一种基于合奏分类器的新型体系结构,该结构将1级分类(称为1C)的增强安全性与在没有攻击的情况下的传统2级分类(称为2C)的高性能结合在一起。我们的体系结构称为1.5级(Spritz-1.5c)分类器,并使用最终密度分类器,一个2C分类器(即CNNS)和两个并行1C分类器(即自动编码器)构造。在我们的实验中,我们通过在各种情况下考虑八次可能的对抗性攻击来评估我们提出的架构的鲁棒性。我们分别对2C和Spritz-1.5c体系结构进行了这些攻击。我们研究的实验结果表明,I-FGSM攻击对2C分类器的攻击成功率(ASR)是N-Baiot数据集训练的2C分类器的0.9900。相反,Spritz-1.5C分类器的ASR为0.0000。
translated by 谷歌翻译
在过去的几十年中,人工智能的兴起使我们有能力解决日常生活中最具挑战性的问题,例如癌症的预测和自主航行。但是,如果不保护对抗性攻击,这些应用程序可能不会可靠。此外,最近的作品表明,某些对抗性示例可以在不同的模型中转移。因此,至关重要的是避免通过抵抗对抗性操纵的强大模型进行这种可传递性。在本文中,我们提出了一种基于特征随机化的方法,该方法抵抗了八次针对测试阶段深度学习模型的对抗性攻击。我们的新方法包括改变目标网络分类器中的训练策略并选择随机特征样本。我们认为攻击者具有有限的知识和半知识条件,以进行最普遍的对抗性攻击。我们使用包括现实和合成攻击的众所周知的UNSW-NB15数据集评估了方法的鲁棒性。之后,我们证明我们的策略优于现有的最新方法,例如最强大的攻击,包括针对特定的对抗性攻击进行微调网络模型。最后,我们的实验结果表明,我们的方法可以确保目标网络并抵抗对抗性攻击的转移性超过60%。
translated by 谷歌翻译
环境感知是自动驾驶汽车领域中的一个重要方面,它提供了有关驾驶领域的重要信息,包括但不限于确定明确的驾驶区域和周围的障碍。语义分割是一种用于自动驾驶汽车的广泛使用的感知方法,它将图像的每个像素与预定义的类相关联。在这种情况下,评估了有关准确性和效率的几个分割模型。生成数据集的实验结果确认,更快的分割模型足够快,可以实时在自动驾驶汽车中的低力计算(嵌入式)设备上使用。还引入了一种简单的方法来为模型生成合成训练数据。此外,比较了第一人称视角的准确性和鸟类的视角。对于第一人称视角的$ 320 \ times 256 $输入,更宽松的是$ 65.44 \,\%$均值均值的交叉点(miou),以及$ 320 \ times 256 $的输入,从鸟类的眼睛的角度来看,forppective fore fore fore fore fore fore foreveves foreveves fore fore fore fore for。 \,\%$ miou。这两种观点都在Nvidia Jetson Agx Xavier上达到每秒247.11美元的框架率。最后,测量并比较目标硬件的算术速率和相对于算术16位浮点(FP16)和32位浮点(FP32)的精度。
translated by 谷歌翻译
我们提出了一种新型的量子算法,用于相对于状态空间大小的对数估算肌关系时间的吉布斯分区函数。这是\ v {s} tefankovi \ v {c},vempala和vigoda [jacm,2009]的\ v {s} tefankovi \ v {c}的开创性近线性时间算法获得的第一种加速。我们的结果还通过利用量子马尔可夫链的特性来保留在先前工作中获得的二次加速和光谱差距。作为一个应用程序,我们获得了用于计算ISING模型分区功能的最著名算法的新多项式改进,并计算出$ K $ - 色,匹配或独立集的图。我们的方法依赖于开发量子相和幅度估计算法的新变体,这些变体返回几乎无偏的估计,而没有破坏其初始量子状态。我们将这些子例程扩展到几乎无偏的量子平均估计量,该估计量比经典的经验平均值更快地降低方差。在我们的工作之前,不存在这种估计量。这些具有普遍兴趣的属性会导致在计算分区函数的模拟退火范围内获得更好的收敛保证。
translated by 谷歌翻译
我们考虑分散的优化问题,其中许多代理通过在基础通信图上交换来最大程度地减少其本地功能的平均值。具体而言,我们将自己置于异步模型中,其中只有一个随机部分在每次迭代时执行计算,而信息交换可以在所有节点之间进行,并以不对称的方式进行。对于此设置,我们提出了一种算法,该算法结合了整个网络上梯度跟踪和差异的差异。这使每个节点能够跟踪目标函数梯度的平均值。我们的理论分析表明,在预期混合矩阵的轻度连通性条件下,当局部目标函数强烈凸面时,算法会汇聚。特别是,我们的结果不需要混合矩阵是双随机的。在实验中,我们研究了一种广播机制,该机制将信息从计算节点传输到其邻居,并确认我们方法在合成和现实世界数据集上的线性收敛性。
translated by 谷歌翻译
了解工作需求的演变对于工人,公司和公共组织遵循就业市场的快速转型而变得越来越重要。幸运的是,最近的自然语言处理(NLP)方法允许开发方法以自动从工作广告中提取信息并更精确地识别技能。但是,这些有效的方法需要从研究领域的大量注释数据,这些数据很难访问,这主要是由于知识产权。本文提出了一个新的公共数据集fijo,其中包含保险工作优惠,包括许多软技能注释。为了了解该数据集的潜力,我们详细介绍了一些特征和一些局限性。然后,我们使用命名的实体识别方法介绍了技能检测算法的结果,并表明基于变形金刚的模型在此数据集上具有良好的令牌性能。最后,我们分析了我们最佳模型犯的一些错误,以强调应用NLP方法时可能出现的困难。
translated by 谷歌翻译